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(57) L'invention concerne un precede d'affectation 
de taches dans un systeme de traitement de donnees 
numeriques multiprocesseur a systeme Sexploitation 
preemptif et une architecture pour la mise en oeuvre de 
ce procede. Le systeme comprenant des processeurs 
(200-203 et 210-213) susceptibles de traitor les taches 
en parallele repartis en groupes (200-201, 202-203) 
Une file d'attente elementaire (5 a , S b ) est associee a 
chacun des groupes de processeurs (200-201 
202-203) et enregistre des taches a executer Toutes les 
taches a executer (7, a 7 10 ) sont enregistrees dans une 
table (4). Chacune des taches (^ a r 10 ) de la table (4) 
est associee a Tune des files d'attente (5 a , 5 b ) et chacu- 
ne des taches enregistrees dans les files d'attente (5 a , 
5 b ) est associee a Tun des processeurs (200 a 201 ) Les 
associations sont effectuees par des jeux de pointeurs 
croises (p 2?0 a p 203> PP 5 a , pp 5bi pT A , p r s> p r 10 , Psfl1 a 
Psa4. P561 ^ Pswo)- Dan s un mode de realisation sup- 
plemental, selon plusieurs variantes, on procede a un 
(re-)equlibrage de la charge du systeme entre files d'at- 
tente elementaires. 
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cesseurs a l*une des files d'attente elementaires. 

[0015] Cette disposition pemnet notamment de limiter le nombre de processeurs accedant aux verrous et done de 
limtter Je phenomene de contention. 

[0016] Cependant. I'experience montre que, lorsque le nombre de taches et le nombre de processeurs augmentent 
la disposition precitee ne permet plus d'ameliorer les performances du systeme. 
[0017] Ceci est du a plusieurs phenomenes et notamment aux suivants : 

[0018] Dans un systeme d'oxploitation moderne existent deux types de taches : les taches a priorite variable et les 
taches a priorite fixe. Les taches du premier type sont des taches dont la priorite varie en fonction du temps de pro- 
cesses consomme (la politique d'ordonnancement est definie par le systeme d'exploitation lui-meme). Les taches du 
second type sont des taches dont la politique d'ordonnancement est fixee lors de la definition de la tache par le pro- 
grammeur. r 

[0019] En premier lieu, la gestion des taches de priorite fixe dans un systeme comportant plusieurs files d'attente 
selon une premiere caracteristique du premier mode de Invention, peut devenir complexe, car il est necessaire d'eviter 
qu'une premiere tache de priorite plus elevee soit executee apres une seconde tache de priorite moins elevee Cette 
gestion s'avere en effet difficile, et surtout couteuse en temps, lorsque les deux taches precitees sont dans deux files 
d'attente distinctes. On concoit aisement que cette difticulte augmente rapidement avec le nombre de taches qui se 
repartissent dans un grand nombre de files d'attente. 

[0020] Le probleme subsiste pour des taches de priorite variable, mais la difficult de mise en oeuvre est moindre 
car e'est le systeme d'exploitation lui-meme qui fixe les priorites, et il peut se permettre de violer ses propres regies 
[0021] En second lieu, le traitement des taches peut devenir desequilibre. Les taches etant, a priori, de natures 
heterogenes, le temps necessaire au traitement de celles-ci peut varier dans de fortes proportions d'une tache a I'autre 
II s'ensuit que un ou plusieurs processeurs, ou groupes de processeurs, peuvent se trouver en sous^charge voire 
devenir inactifs, faute de taches a traiter (les files d'attente associees s'etant videes), alors qu'un ou plusieurs autres 
processeurs, ou groupes de processeurs, continuent de traiter des taches (voire etre surcharges) et qu'il reste des 
taches a executer dans les files d'attente associeos a ceux-ci. Aussi, dans un second mode de realisation prefere de 
Invention, tout en conservant les dispositions propres au premier mode de realisation (partition des files d'attente) 
on procede a un reequilibrage du traitement des taches, selon plusieurs variantes. 

[0022] Selon une premiere variante, le reequilibrage comprend une repartition optimisee des taches entre les diffe- 
rentes files d'attente du systeme. Le mode de repartition tient compte de differents parametres qui seront precises 
dans ce qui suit. La repartition peut etre effectuee, soit lors de la creation de la tache, soit lors de I'association realisee 
entre la tache et un fichier contenant le programme a executer. 

[0023] A titre d'exemple, dans un environnement de type "UNIX 0 precite. cette association est realisee par une ins- 
truction de type : 'exec() a . Cette seconde option est preferable lorsque le systeme m u ft ip roc esse ur est du type "NUMA' 
precite. 

[0024] Cette disposition ameliore les performances du systeme, y compris lorsque le nombre de taches a traiter est 
tres eleve. Cependant, la courbe representant les performances presente des oscillations, qui traduisent des instabi- 
Irtes, notamment lorsque le nombre de taches devient eleve. En outre, il est encore possible d'ameliorer les perfor- 
mances. 



[0025] Selon une deuxieme variante de realisation du second mode, lorsque la file d'attente associee a un proces- 
ses, ou a un groupe de processeurs, devient vide et que le processeur ou au moins run des processeurs n'a plus de 
tache en cours de traitement, le processeur recherche dans les autres files d'attente s'il existe des taches en attente 
de traitement. Si cette recherche est positive, dans un mode prefere, le processeur recherche ce qu'on pourra appeler 
la "meilleure tache a traiter", s'il existe plusieurs taches en attente. Le mode de recherche et de selection de cette 
tache sera precise dans ce qui suit. 

[0026] On doit bien comprendre que dans ces deux variantes, I'affectation des differentes taches aux differentes 
files d'attente reste inchangee. L'association des premiere et deuxieme variantes precitees est particu lierement efficace 
pour ('amelioration des performances du systeme tant que de nouvelles taches se creent en permanence Par contre 
lorsque cet elat cesse, par exemple en fin de travail du systeme, on peut etre amene a constater de nouveau des 
d6sequilibres de charge. 

[0027] Aussi, Invention peut comprendre une troisieme variante de realisation, dans laquelle on reaffecte des taches 
entre differentes files d'attente, de facon periodique par exemple. 

[0028] Cette disposition n'a generalement que peu d'effet en regime normal (creation continue de taches) sur les 
performances d'un systeme multiprocesseur symetrique, e'est-a-dire du type "SMP W precite. Elle peut cependant seve- 
rer utile pour un systeme de type "NUMA 13 precite. 

[0029] L'invention a done pour objet un procede d'affectation de taches dans un systeme de traitement de donnees 
numenques multiprocesseur, a systeme d'exploitation preemptif, comprenant un nombre determine de processeurs 
susceptibles de traiter lesdites taches en parallele, caracterise en ce qu'il comprend au moins une phase preliminaire 
pendant laquelle lesdits processeurs sont repartis en groupes, chaque groupe comprenant des nombres predetermines 
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Krtitfonlie SS XZ!?!!^ * |,inVen,i ° n ' danS un premier mode de f ^lisalion. on prevoit 

et Tverrous ^ ^ Verr ° US qUi lul S ° nt aSSOCieS ' en p,us ' eurs ensembles de *4ente 

10 S em mfn, Ure . 2 illUStre sch6ma,ic ' uemenl exemple d'archi.ecture de ce type. Le systeme 1 comprend comma 
cTmZbI ' S pr ° CeSSeurs ^Pendant, ces processeurs ant ete rassembles en groupesde processes 

^SXT«rSKS»?a 8 B St e,r ^r" 6 9rOUPe ' °«* ^ P6Ut c ™ p ™ d ™ nombreid^ue ou 
pwwirriai 8 I ?'/? eXemP ' e ' ° n 3 SUPP ° Se arbilrai 'ement que le groupe G a comprenait deux 
is raS^En 9 P * ° ,S proce sseurs, ^ 6 22* et le groupe G, un seul processes 20 

SdLmfe^ P , rem , ,ere caracteristic ' ue importante de ('invention, la file d'attente unique Sre 1 5) 

6oa?au nTmL I " U ™ P>M ' MeS d ' a,tente - De fa ?° n P lus P**« encore, le nombre de Ls Sente est 
dtilT 9 !"1 e n dS processeurs - so " <™ files d-anente dans rexemple de la figure 2 5 a 5 chaque file 
d attente etant associee a I'un des groupes de processeurs G a G " q 

« !E3. Attune 3 ST " a ° tre imPOr,am ' ChaqUe * * ^ " a « eCt6e a - da »en.e particu- 

Ea jeux SSESr aSSOCiati ° nS S ' effeC,Uen,i C ° mme " 16 "™ m ° n,r6 ^ - -^ard de ,a figure 4, * 

b^™^* n ° mbre d ! 9rOUPSS dS Poseurs, ^ done du nombre de files elemental, depend de nom- 
breux parametres dans un systems multiprocesseur de caracteristiques donnees. Generalement cette rtoartrtiiTe 
SZlSrfZ f tenUS r f ^ Ca ' CUlS Pr6a,ableS ' mais <*» '"experimentation et .amesure. ' "* 

e^Srtitton d« tth« Xe " d ' au 9 me n.er les performances globa.es du systeme par le biais d'une meil.eu- 

une Sat in^I T Z ntreprOCesseurs 'ndividuels. Aussi. les experimentations et tests precites consisted dans 
saxon™ J 1 f Programmes de test et de reference, dits 'benchmark- selon la terminolog^anqlo 

30 IZ Z I f , ! SXeCUter Par 16 SyS,eme ^ r6parti,ion de * Processeurs en groupes assoctesTdes fHes 
d J 1 Sn t e,em e" ,a 'res donnant les meil.eurs resultats, d'un point de vue performances est retenueTce sfade ll 

SHestl i?rQtL a ' ement " 9e ' ee ° 61 UtHiS6e POUf ,SS SyS,em - de meme «^"» fab"qu,s ar Ta suit^ 
unTfiiL riL^nf/i h P^sumer que. a pr/on; les meilleures performances devraient etre atteintes en associant 
Zllllt Tlr, , T dSS pr ° cesseurs En d'au.res termes. chaque groupe serai, reduit a un seu^roceSeur 
35 Sfli n " I"" Sn ? endrer des difficultes de realisation. Aussi. un compromis est generalement prS 
dr,Le"se~^o n n d6Cnre * ^ P ' US Ce ^ m0de d * d " P«^S — 

EL? 6 "? C ° mme " 3 6,e indiqUe> les arch itectures des systemes muftiprocesseurs du type "NUMA" ac- 

ce et rappe,er b — - — -stiques P r C i P r d, a ne 

[0051] Le systeme 1 est divise en modules, par exemple en deux modules. ^ et M, comme represent sur la fiaure 

2^nZ2 \ 1 Prjcte represents en general une valeur optimale. Les processeurs de chaque modu.e 1 e 2 Tsont 

chacun un sous-systeme de type "SMP° or^citA i « m rJ„r~o *^ , »>. . , . ' mt ""o 61 /we/n,, torment 
c! U «ta. mo h„ „,h«l ^> . ^ Precite. Les modules, Afe et M,, sont relies entre eux par un lien L et un 

ST °, ' ^ qU ' cons,itue nt un prolongement des bus internes precites 

I „n h ^ COnf0,t a ' S6ment que " par exemple, la lecture ou I'ecriture d'une donnee de ou dans une memoire externe 
fa P po7a^, am ?me^^^ °* 86 P3r U " e d6 9-dation des performances du^mfpar 

7Z1h , operat,on ent.erement execu.ee a I'interieur d'un meme module. Les performances sont eqaTemen 

s^srsjs tirr iter d ' un moduie a ^° par ,e - qui — 
[£Shi t r^^ 
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chacune des files d'attentes, respectivement 5 et * • r 7- A * t t i~ -« ~ 

5" 3 , reS " CS ,aire ' °" P9Ut r6sefVer une ,i,e d " atten,e aux t§ches a P fi °"te fixe SeSs ce e 
d,sposmon n est pas toujours env,sageable. C'es. le cas par exemple lorsqu'un processus comprend des tSches^iees 

K? 7 ! 1 - E 1 ° U ! re ' ' e PrOC6d<§ P6rmet ' danS une architecture de type "NUMA" d'implanter un mecanisme dit de "Weak 
1 5 IZJTu ,erm,n0l ° 9ie -9lo-saxonne. Un ,el mecanisme favorise .'execution dune Sche u7u fjrocestur 
d un module unique, ce qui penmet de tirer un p.us grand beneficie de la memoirs cache dite de -nivea 3"Tssoc^ e 
au module. Or, pu.squ-i. est possible d'associer une file d'attente a des processeurs appartenam a ™™ it 
d^stnbuteur peut a.sement confiner les laches dun processus dans un seul module ' 
L^LonLc^ 6 56,00 Pr6mier m0de * r6a,isa,ion tra " v ^ cependant des limites lorsque le nombre de taches 

slnZI 08 19 tempS dQ ,rai,Sment « P«ut arriver qu'une ou plsieuTfile S 

scent v,des ou peu chargees, etdonc que les processeurs des groupes qui leursontassocies soient In snu^rnl 

iZZ'unl P ° U V e m ° inS jUSqU '" dS nOUVe " eS taChSS - * -tel^Sfl^IS^S; 

Zn^Zr^^rK a w re l fMeS d ' a,,ente PeUVent Pr6senter des charges importan.es. I. ap P S, done un 
phenomene de desequ.hbre de charges. qui a d'au.an. p.us de chance de se produire que le nombre de files d attend 

SLS? d,SP ( 0S,, ' 0ns ^PPlementaires permettant un (re-)equilibrage de la charge entre e « rentes f X 
d attentes, ou pour le mo.ns un trai.ement optimise des aches reparties dans les files d'atten.e de manie e a ce oue 

S,„ a f S ° pera !T necessai ^s pour obtenir cette configuration a files d'attente multiples, generalement effec- 

" r C ( UmU,era C6S tf0iS mecanism ^ le moins les deux premiers qui donnenUes meiCs 

esuliats quant aux objectrfs poursuivis par Invention, comme il le sera precise cypres. 

T f Pr ^! 6re Varian,e dS r ° alisa,ion - un ^quilibrage des taches est obtenu en les repartissant de facon 
opt m see en.re les drfferen.es files d'attente lorsqu'elles apparaiseent "physiquemenf. et non plus simptementl tour 

™£l ' *T t r °S' P - eC,,6> - ^ ,a? ° n Pr6CiSS de Ch0i8ir une file d ' aHente va Poises cypres 
Et J! «5" r H X ' eme 8n,e dS r6alisa,ion ' un reequilibrage du traitement des taches est obtenu en optimisant 
* quTl D Ts T.^h PrOCeSSeU ^- Lorec « u ' u " «**•-«" detecte que la file d'attente qui lui est assc^esTvS 
e o?anL« i 15 , T ?° UrS d ! ,rai,emenl ' « va ch ^^^ une teche a traiter dans une autre file d'attente d"e 
elo,gnee, en effectuant un balayage des autres files detente du syst^me, jusqu'S ce qu'il trouve une file d'attTnS Zn 
v,de et don, la charge est superieure, a priori, a un seuil determinl Le choix d'une ^^^T* £l£lZ£ 
se.ect IO nnee. s'effectue se.on un processus qui va etre de.ai.le ci-apres. De fa ? on pratique, e'est "e -dTs^cher- qui 
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aussi calculee a chaque fois qu'une instruction d'execution est initiee 

^l h ^ a V T bie s Char9e - FA \ eSX Variab ' e com P° site comprenan. des constantes (coef charge CPU, et 
Z?F^ 9 7 , * y J qU ' P ! UV8nt S,fe StOCk6es dans une variab,e 9 ,obale et son « susceptible tf etre ajustee ("tunable" 
5 'on IT T eUr ,? U SyS,6mS P ° Ur ° btenir " n r6su,ta1 °P ,imum - Les au1res composantes de la variable chaTe FA 
S ,^ h f ° eS -T ^ ^ P3rtir d8 P ' USieUrS P a ' ama ^ decrivant le systeme, notamment a partir dTnomil 

dL memofrt r 8, ! TT^ ^ * ^ P3r '* " SChedU,6r ° COnCeman ' les files d ' a " ente « d e roccupatton 
iiZT f . , 6S Stat ' S,lques " pour ,a P |u P a rt. son. generalement disponibles dans les systemes informariques 

.Wnl S , H S6eS * d aUtr6S ,inS qU8 Ce " es propres * rinven,ion - Le sur «>" dO aux dispositions pTop es a 
"nvent.on, en termede temps de calcul supplemental, esl done negligeable ns propres a 

i . f", Ce qui , co " cerne P |us Particulierement les calculs permettant de determiner la charge d'une memoire il 

E3U ^ 3 biSn C ° nnUeS mettant Sn ° eUVfe des al 9° ritnmes d"estim5ion lineaTre ou non 

TrVL^V 6 13 CrSati ° n , d '^ e nOUV8 " e r ' 61 une ,ois que la file d ' attente la moins bargee a ete trouvee 

rs fr£? ^i ' P e , XemP '! 13 f " e d ' at ' en,e 5y - 13 noUvelle ,ache r - est aiaui,lee vers ce « e «' a d'attente paM'omane 
'S 6. Cet aiguillage a ete symbolise, sur la figure 5B. par un simple commutator K 9 

[0092] Ces dispositions presentent de nombreux avantages, notamment les suivants : 

a/ elles permettent de repondre tree rapidement a des motivations egalement rapides du comportement du sys- 
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b/ la determination de la charge composite est simple, car basee sur deux valeurs qui peuvent etre recherchees 
dans une meme ligne de la mimoire cache de "niveau 2" ■ recnercnees 

c/ le mecanisme n'est pas fige : il pourrait inclure d'autres variables, par exemple I'equilibrage de la charge de 
circuits d entrees-sorties ("I/O") uiurge oe 

d/ le desequilibre dans des modules materiels est automatiquement pris en charge (e'est-a-dire le nombre de 
processors et/ou la taille memoire) : en effet .e nombre de processeurs est pris en compte du fart que le paTametre 

du°^rno^T /Paf - aC,,eeSt r ° ,atif 3 Char9S Par prOCeSSSUr et 13 « H * m * moi " °« P«" - comPte 
du fait que le nombre de pages memo.re (ou d'entites similaires) depend de la taille memoire ■ et 

ma^Tir 6 I* adaPte , ^ .I"'"" 16 " 16 3U j6U de ressources = s'il ^iste plusieurs files d'attente partageant un 
meme poo. de memoire, la charge de la memoire est la meme pour tous les modules et seule la charge des 
30 processeurs est significative. marge aes 

[0093] ..'experience montre que les dispositions propres a cette premiere variante du second mode permettent 
d ameliorer les performances globales du systeme. meme en presence d'un grand nombre de files tfatten Te de 
3 s 2 ™ t • Capendam ' on peut consta ^ ^ns certaines circonstances .'apparition d'instabi.ites Pa^empJ 

35 s. I on trace une courbe representant le nombre de laches executees par unite de temps (par exemple par heurT) en 
onction du nombre d'utihsateurs du systeme, ces instabi.ites se traduisent par des osci..a,ions de la couTbe ? 
IThI repr f. S t nte SUr ' a " 9Ure 8 '' allure de la courbe representant .'evolution du nombre de aches executees 

P ll £uZ ( Cr?ZT t e TT r& r sent r par exem P' e P a ' «" ^ript) en fonction du nombre d'uti.isateurs S ^systeme 
40 , J S represents I allure des performances d'un systeme non modifie. e'est-a-dire un systeme de Part conn!" 
40 La courbe C A ..lustre le fonct.onnement d'un systeme component les meme ressources informatiques mais da^equel 
les dispositions propres a la premiere variante du second mode de realisation du procede de I'invemfon «it &6 \m 
p an tees. On consjate que la courbe C A est (dans sa plus grande partie) situee a'^essus deaSeC ce q" 
stgnrfte que .es performances ont ete ame.iorees. Mais la courbe C A presente des oscillations autour d'une position 
moyenne (representee par une interpolation en traits interrompus C>*) . On constate aussi. dans .'exemple de K 
a que certaines osc.llat.ons font passer la courbe C A en dessous de la courbe C. Pour ces poteT^ 
systeme est moms performant qu'un systeme equivalent de I'art connu 

[0095] Aussi. il est preferentiellement fait appel a la deuxieme variante de realisation du second mode du procede 
rr^ T T' 1° 165 d ' SpOSitions sp^cifiques peuvent se cumuler avec celles de .a premiere variante 
[0096] Conformement a cette deuxieme variante du second mode de realisation du procede selon Invention lors- 
qu un processes constate que .a file d'attente qui .ui est associee est vide et qu'i. devient inactif. i. va cheSer une 
Tun ,aCh ^ t XeCUtabl ^ danS H Une ,,ste d " a «cnte eloignee, non vide, ou pour le moins dont le taux de charge est supJrieur 

T'll^l ! i9 Ll 9 fi 6 ^ 81 SCh6malic » uemef1t ™ ™°d* ^ recherche possib.e d'une tache dans .es files d'attentes 
qu'en" tLnTque tie besoT C ° mmUnS fi9Ur6S p - Ceden,es portent ** ™*™s references et ne seront remits 

ret!!! oaNe'Toataher-'? 'ST* " * *** m ° n,r6 ^ W * ' 3 ,igUr6 4 ' 165 P rocesseurs des requites 

recues par le dispatcher 3. On suppose ,c, que la file d'attente 5, du processeur 2, est vide et que celui-ci devient 
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fesquL les ZElSX™" * ^ 9rand n0mhM de faC,SUrS ^ d,re P ris en com P' e - « P«m. 

5 JtcSHIwT 60 Un PrOCeSSeUr> c " es, ^ dire le 'ail que la demiere distribution de la tache s'est effectuee sur ce 

2/ raffinite avec un module, dans le cas d'une architecture de type "NUMA 0 , c'est-a-dire le fait que la derniere 
distribution de la tache s'est effectuee sur ce module ; uemiere 
3/ la priorite affectee a une tache ; 
4/ la localisation de la tache ; 
'0 5/ le fait que la tSche ait d6j& 6te "aidee" ; 

6/ le fait que le processus soft mono-tache ; 
7/ la quantity de memoire accSdee par la tache ; 
8/ I'utilisation du processeur ; et 
9/ la duree de vie de la tache. 
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[0111] En ce qui concerne le facteur 3/ (priorite), il est preferable de 'sauter' les tache de plus haute priorite c'est- 
a«,re les premieres taches dans la file d'attente "aidee". En effet, la probability est grande qu'el.es soiem prises en 
charge par un processeur local, du fait precisement de ,a haute priorite qui leur est associee. avan qu e lie pui se etre 
trai ee par le processeur eloigne. ^utilisation dun seuil predetermine semble etre une solution appropriee pour ce e 

qTSnHe^ 

[011 2] La determination d'une valeur de seuil est importante. En effet, si la valeur de seuil est trop basse c'est-a- 
d.re que le nombre de taches sautees est trop faible. le mecanisme d'aide se trouve alors souvent en cifli't alec le 
mecamsme standard de distribution des taches, c'est-a-dire le mecanisme commun a I'art connu. En sens onUaTrl 

plJemem ^ace 0 " 6 "* ^ ^ "*» 00 POUrra M ° * ' e ™ CaniS ™ d ' aide ^ °™ 

[0113] De facon preferentielle, pour etre aussi independant que faire ce peut de la charge de travail on met en 
oeuvre un precede auto-adaptatif. par exemple le suivant • 

k ^ ™" brede * aches SaUt6SS 6St fixe a une valeur com P rise en,re "^bre de processeurs et le nombre 

■ h S enS6mb,e ^ fNe d ' a " Bnte Cette Va ' eur eSt incr6men ,6e d " une M *-!»■ tois due a 
d w T U T 8 a ' dee SSt - SOIt d6j6 verrooil '^. soit n'est pas a I'etat executable. Cette valeur est decrements 

aTmo^ 

ErcLh^H^cT maXim M L d V, a l heS 3 ba ' ayer SSt fix6 6 Une valeur com P rise en,re runite et nombre de taches 
execu ables dans ."ensemble de file d'attente. Cette valeur est increments d'une unite chaque fois qu'aucunetache 
n est trouvee ou chaque fois que la tache choisie se trouve dans le dernier quart des taches balayees (laches oe plus 

o^sS?^ Tf 6 Va 'r T d6cr6men,6e d ' une ««• ^aque fois que la tache choisie se trouve ins le premier 
quart des taches balayees (taches de plus hautes priorites) 

SIS ^ L H^ C l e "l 4/ K (IOCa,iSa,i ° n) SSt ' 3 Pri ° ri ' faCteur tras im P ortant - Cependant. ce facteur est generalement 
s^ent ^TZle enVir ° nnement de *P e ' a '^lisation de la tache soft connue pa! 

n°J,!!L En °h ^ COnC , eme le facteur 5/ - on P e "» generalement admettre que, si une ta.che a deja ete "aidee" elle 
peutdejaresiderdansplusieursmodulesj 

en terme de degradation de performances, operation couieuse 

%HZL , E n CS qui f Concerne le ,ac,eur 71 • » s 'ag« ^galement d'un facteur important, mais qui ne peut etre determine 
a.sement. Deux criteres permettent d'arriver a une approximation raisonnable: ire oeterm.ne 

a/ la taille memoire utilis6e par le processus ; et 

b/ "I'interactivite- de la tache, ce critere etant defini par le fait qu'une tSche sort souvent -dormante- ou non. 

Leu,! h^ZT 1 rT ° b, ! nU 3 Paftir d ' Un com ^ du " or "bre de fois ou elle est a I'etat "dormant', ce qui 
peut se deriver de statistiques generalement disponibles 

Same les ^ITJ^Z" h "T? " SSt aiS " de com P rendre ^'i' P*s utile de tenter de prendre en 

Sf™ ^ 6 de V '°- En Sffet ' ,a P ,upart d ' entre elles disparaissent a court terme 

EL HJ? tenan ! 4 COmpte d « ,0 "' ou P artie de "8 different facteurs, il est possible de determiner quelle tache doit 
etre se ectionnee dans une f.le d'attente. en definissant un cout individue. associe a chaque facteur et d'en d/duire 

"coTs ? :s r°f * , une : ache particuiiere on peut »™ - ,aire c ° ns,r - e ,a ^ a da - 

- couts. La tache presentant le cout global le plus faible est selectionnee, e'est^-dire ce.le causant la degradation 
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si [|CD5-2B)| < \\A5\\ trouver la file d'attente d'indice arbitraire y pour laquelle le parametre \\CLp - a3\\ est 
minimal ; 1 11 



- migrer ce processus vers I'ensemble de file d'attente le moins charge 5„ et 

- mettre a jour le jacteurrepresentatif du desequilibre des deux ensembles de file d'attente. sort W = a5 - 
5 CL P x et AD y - AD y - CLPy. * * 

[0134] Le vecteur de charge composite est un vecteur a trois dimensions. En effet, il depend des parametres 

*° - charge du processeur ; 

charge de la memoire ; et 
priority. 

,5 I? 1 ^ Premi ! fS parame,res dependent a leur tour de la configuration materielle et logicielle precise du 

« systems cons.dere .nombre de processeurs. taille de la memo.re. nombre de pages memoire libres, etc La Storm." 
nation de ces parametres est commune a I'art connu et obtenue par des calculs classiques, biens connus de I'homme 
miT«i tk! parame,re priori,e ° est obtenu a Panir de la moyenne des priorites attachees aux differentes taches 
[01 36] Theonquement, la determination de la charge d un ensemble de file d'attente est donnee par la somme des 
charges de processus. Mais pour accelerer cene determination, on la derive directement a panir de statistiques ge- 
» neralemen. stockees dans la structure de donnees de cet ensemble. La charge depend de nouveau de trois 
parametres : charge du processeur, charge de la ntomoire et priorite. 

[0137] La determination de la charge composite moyenne peut etre obtenue a partir de la relation suivante 



ACL = ^ (3) 

P 

relation dans laquelle est la charge composite du ensemble de file d'attente et p le nombre total d'ensembles de 
rue dattente. 

[0138] Le desequilibre moyen peut etre determine a partir de la relation suivante : 
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AD, - AD ' + hL ~ ACL > ) 



(4) 



n?l , La f d w 6 ! e . rm,nat,on du cout assoc| e a "ne operation de migration peut etre obtenue en considerant que le cout 
principal est du a la m.grat.on de pages de memoires, dans un environnement de type "UNIX'' (ou a I'acces a des 

9neSS) 61 aU 0001 ' ie 3U d6 P laceme "t d'une tache d'un ensemble de file d'attente a un autre 
[0140] Une approx.mation de I'estimation du cout est obtenue directement par le nombre de pages associees au 

*^ZllV*"T'l ^ ^H heS d6Van1 §tr8 d6 P bc6es Dans u " environnement autre que I'environnement 
UNIX , I entite page de mdmoire" doit etre remplac6 par une entrte 6quivalente 

45 -w - 41l o. CeS m °f SS d8 d6termina,ion des Parametres impliqu6s ne sont precises qu'a litre d'exemple, pour fixer les 
idees. D'autres alternatives existent et sont a la portee de I'homme de metier 

[0142] Si on se reporte de nouveau a la figure 8, la courbe C c illustre schematiquement failure de ('amelioration des 
performances par rapport a I'art connu (courbe C). Cependant, ('experience mon.re que, dans le cas general I'ame- 
horanon obtenue par rapport a celle obtenue par la deuxieme variante est peu importante. Ceci est du essentieilement 
au fart que le deplacement physique des taches entre files d'attente implique un cout non negligeable ce meme si 
celu.-c, nest pas general.se, conformement aux dispositions preferentielles qui viennent d'etre rappelkes mais au 
contra.re s6lectif. On reservera cette variante du precede selon ('invention a une architecture de type "NUMA" car 
dans le cas d'une architecture classique de type "SMP", Pam6lioration des performances n'est pas significative alors 
que sa m.se en oeuvre necessite des modifications du syst6me d'exploitation et la presence d'organes supplementai- 
res, materiel ou logique (figure 7:8). 

SIS u I 3 ' eCtUre dS 06 qUi P r6c§de - 00 constate aisement que ('invention atteint bien les buts qu'elle s'est fixes 
[0144] II dort etre clair cependant que ('invention n'est pas limitee aux seuls exemples de realisations explicitement 
aecrits, notamment en relation avec les figures 2 et 4 £ 8. 
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de charge composite est calcule comme etant la somme de la charge d'un processeur ou d'un groupe de oroces 
seurs associe a ladite file d'attente elementaire et la charge des moyens de memoire associee a ce processor 
ou ce groupe de processeurs. 

8. Precede selon la revendication 6, caracterise en ce qu'il comprend une etape prealable consistant a tester si ladite 

t1T2 6 J!t? Z) ? d ^ di1 f fil6S d ' aMente 6l6mentaires (5a. S„ 5 r 5 p ) e. en ce que lorsque ledit 

test est positrf a aiguiller ladite nouvelle tache vers cette file d'attente elementaire. 

9. Precede selon rune quelconque des revendications 1 a 5. caracterise en ce qu'il comprend au moins une phase 
supplemental consistant, lorsque I'une desdites files d'attente elementaires (5J associee a I'un desdits qroupes 
de processeurs (2,) est vide de taches executables, a rechercher une file d'attente elementaire (5 ) dite eloionee 
non vide et dans cette file d'attente elementaire (5 y ) a selectionner une tache executable par I'un'desdits proces- 
seurs (2,) dudit groupe de processeurs associe a la file d'attente elementaire vide (5.) et a la transmettre a ce 
processeur (2,) pour y etre traitee, de maniere a equilibre globalement le traitement desdites taches dans ledit 
systeme (1). 

10. Precede selon la revendication 9, caracterise en ce que ladite file d'attente elementaire non vide (5.) do.t presenter 
un seuil d'occupation minimal pr6d6termin6. y Hiwoniw 

11. Precede selon la revendication 1 0, caracterise en ce qu'en outre, les taches etant enregistrees par ordre de priorite 
decro.ssante. un nombre predetermine de taches est saute avant de balayer les autres taches de ladite file d'attente 
elementaire non vide (5 y ) pour rechercher une tache executable et la faire trailer par I'un desdits processeurs (2 ) 
dudit groupe de processeurs associe a la file d'attente Elementaire vide (5,,). * 

12. Precede selon la revendication 11 . caracterise en ce que ledit nombre de taches sautees et le nombre maximum 
de taches balayees parmi toutes celles enregistrees dans ladite file d'attente elementaire non vide (5 ) sont va- 
riables dans le temps et sont determinds par un processus auto-adaptatif a partir du nombre de taches trouvees 
ou non pendant lesdits balayages et de la place de ces taches class6es par ordre de priorite dans ladite file 
elementaire non vide (5^). 

13. Precede selon I'une quelconque des revendications 9 a 12, caracterise en ce que ladite tache selectionnee est 
ceHe associee k une valeur minimale d'un parametre dit de cout. mesurant la degradation de performances globale 
dudit sys erne (1 . due au traitement de ladite tache selectionnee dans ladite file d'attente elementaire eloignee 
non v.de (5,) par I un desdits processeurs dudit groupe de processeurs associe a la file d'attente elementaire vide 
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14. Precede selon I une quelconque des revendications 1 a 5, caracterise en ce qu'il comprend au moins une phase 
supplementaire comprenant au moins une etape de mesure periodique d'une repartition equilibree desdites taches 
dans lesdites files d attente elementaires (5 a , 5„ 5y , 5p ) et. lors de la determination d'un etat desequilibre dudit 
systeme (1), une elape de deplacement selectif de taches d'au moins une file d'attente elementaire plus charqee 
(5 X ) vers une file d'attente 6l6mentaire moins chargee (5 y ). 

15. Precede selon la revendication 14, caracterise en ce que, lorsque ledit desequilibre est inferieur a un seuil deter- 
mine, aucun deplacement de tache n'est r§alis6. 

16. Precede selon les revendications 14 ou 15, caracterise en ce que tout ou partie desdites taches apparienant a 
des processus multitaches, chaque processus multitache necessitant une taille de memoire et une charoe de 
travail determ.nees. il comprend une etape de mesure desdites charges de travail et desdites tallies de memoire 
en ce qu'il comprend la selection du processus necessitant la plus forte charge de travail et la plus faible taille de 
memoire, et en ce que ce que toutes les taches dudit processus selectionne sont deplacees vers la file d'attente 
Elementaire la moins chargEe (5 y ). 

17. Precede selon la revendication 1 6, caracterise en ce qu'il comprend une 6tape preliminaire consistant a tester si 
toutes les taches dudit processus multitache devant Stre dEplacees appartiennent a I'ensemble de file d'attente 
elementaire le plus chargS (5,) et si aucune tSche n'est liee a I'un desdits groupes. 

18. Precede selon I'une quelconque des revendications 1 a 17, caracterise en ce que ledit systems d'exploitation est 
du type "UNIX" (marque deposee). 
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